检索结果

Select

1. 低编译复杂度的双容错阵列码

解峥, 王子豪, 唐聃, 张航, 蔡红亮

《计算机应用》唯一官方网站 2023, 43 (9): 2766-2774. DOI: 10.11772/j.issn.1001-9081.2022091344

摘要（189）

HTML （9）

PDF （2691KB）（61）

纠删码技术是独立磁盘冗余阵列-6（RAID-6）的双容错能力的底层实现技术，它的性能是左右RAID-6性能的重要因素。针对RAID-6中常用阵列纠删码的I/O不平衡和数据恢复速度慢的问题，提出一种基于异或（XOR）的混合阵列码——J码（J-code）。J-code采用新的校验生成规则，首先，利用原始数据构造的二维阵列计算出对角校验位并构造新的阵列；然后，利用新阵列中数据块之间的位置关系计算得到反对角校验位。此外，J-code将原始数据与部分校验位存储于同一磁盘，能减少编译码过程中的异或（XOR）操作次数和单盘恢复过程中读取数据块的个数，从而降低编译码复杂度和单盘故障修复的I/O成本，缓解磁盘热点集中现象。仿真实验结果表明，相较于RDP（Row-Diagonal Parity）、EaR（Endurance-aware RAID-6）等阵列码，J-code的编码时间减少了0.30%~28.70%，单磁盘故障和双磁盘故障的修复用时分别减少了2.23%~31.62%和0.39%~36.00%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. L1正则化的深度谱聚类算法

李文博, 刘波, 陶玲玲, 罗棻, 张航

《计算机应用》唯一官方网站 2023, 43 (12): 3662-3667. DOI: 10.11772/j.issn.1001-9081.2022121822

摘要（338）

HTML （31）

PDF （1465KB）（310）

针对深度谱聚类模型训练不稳定和泛化能力弱等问题，提出L1正则化的深度谱聚类算法（DSCLR）。首先，在深度谱聚类的目标函数中引入L1正则化，使深度神经网络模型生成的拉普拉斯矩阵的特征向量稀疏化，并提升模型的泛化能力；其次，通过利用参数化修正线性单元激活函数（PReLU）改进基于深度神经网络的谱聚类算法的网络结构，解决模型训练不稳定和欠拟合问题。在MNIST数据集上的实验结果表明，所提算法在聚类精度（CA）、归一化互信息（NMI）指数和调整兰德系数（ARI）这3个评价指标上，相较于深度谱聚类算法分别提升了11.85、7.75和17.19个百分点。此外，所提算法相较于深度嵌入聚类（DEC）和基于对偶自编码器网络的深度谱聚类（DSCDAN）等算法，在CA、NMI和ARI这3个评价指标上也有大幅提升。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于字典的域名生成算法生成域名的检测方法

张永斌, 常文欣, 孙连山, 张航

计算机应用 2021, 41 (9): 2609-2614. DOI: 10.11772/j.issn.1001-9081.2020111837

摘要（397）

PDF （893KB）（298）

针对基于字典的域名生成算法（DGA）生成域名与良性域名构成十分相似，现有技术难以有效检测的问题，提出一种卷积神经网络（CNN）和长短时记忆（LSTM）网络相结合的网络模型——CL模型。该模型由字符嵌入层、特征提取层及全连接层三部分组成。首先，字符嵌入层对输入域名的字符进行编码；然后，特征提取层将CNN与LSTM串行连接在一起，对域名字符特征进行提取，即通过CNN提取域名字符的 n-grams特征，并将提取结果输入给LSTM，以便学习 n-grams间的上下文特征，同时，为了学习不同长度的 n-grams特征，可选择多组CNN与LSTM结合使用；最后，全连接层根据提取到的特征对基于字典的DGA生成域名进行分类预测。实验结果表明：当CNN选择的卷积核大小为3和4时，所提模型性能最佳。在四个基于字典的DGA家族的测试对比实验中，CL模型与CNN模型相比，准确率提升了2.20%，且随着样本家族数量的增加，CL模型具有更好的稳定性。

参考文献 | 相关文章 | 多维度评价

Select

4. 分布式存储系统中的低修复成本纠删码

张航, 刘善政, 唐聃, 蔡红亮

计算机应用 2020, 40 (10): 2942-2950. DOI: 10.11772/j.issn.1001-9081.2020010127

摘要（393）

PDF （1250KB）（929）

纠删码技术是分布式存储系统中典型的数据容错方法，与多副本技术相比，能够以较低的存储开销提供较高的数据可靠性；然而，纠删码修复成本过高的特点限制了其应用。针对现有纠删码修复成本高、编码复杂和灵活性差的问题，提出一种编码简单的低修复成本的纠删码——旋转分组修复码（RGRC）。RGRC首先将多个条带组合成条带集，然后利用条带之间的关联关系对条带集内的数据块进行分层旋转编码，以此得到相应的冗余块。RGRC大幅度地减少了单节点修复过程中所需要读取和传输的数据量，从而能节省大量的网络带宽资源。同时RGRC在解决单节点修复成本高的问题时，依然保留着较高的容错能力，且为满足分布式存储系统的不同需求，可以灵活地权衡系统的存储开销和修复成本。在分布式存储系统中进行的对比实验分析结果展示，与其他常用的RS（Reed-Solomon）码、LRC（Locally Repairable Codes）、basic-Pyramid、DLRC（Dynamic Local Reconstruction Codes）、pLRC（proactive Locally Repairable Codes）、GRC（Group Repairable Codes）、UFP-LRC（Unequal Failure Protection based Local Reconstruction Codes）相比，RGRC只需要增加少量的存储开销，就能降低单节点修复14%~61%的修复成本，同时减少14%~58%的修复时间。

参考文献 | 相关文章 | 多维度评价